Sự chuyển dịch sang các mô hình được điều chỉnh theo hướng dẫn
Nền tảng là gì?
Trong quá khứ, các mô hình LLM cơ bản chủ yếu được huấn luyện để dự đoán từ tiếp theo trong một chuỗi dựa trên lượng dữ liệu khổng lồ. Tuy nhiên, đối với các nhà phát triển, sức mạnh thực sự nằm ở các mô hình LLM được điều chỉnh theo hướng dẫn. Các mô hình này được tinh chỉnh bằng cách sử dụng học tăng cường từ phản hồi của con người (RLHF) để tuân theo các lệnh cụ thể và hoạt động như những trợ lý hữu ích.
Quy tắc Vàng:Hãy coi LLM như một nhân viên nội trợ thông minh nhưng rất chữ nghĩa. Nó thiếu bối cảnh cụ thể của bạn, vì vậy bạn phải rõ ràng về mục tiêu của mình.
Làm thế nào để áp dụng các nguyên tắc cốt lõi
- Rõ ràng và cụ thể: Rõ ràng không có nghĩa là ngắn gọn. Cung cấp thêm bối cảnh và sử dụng các dấu phân cách (như ba dấu gạch ngược hoặc thẻ XML) giúp mô hình phân biệt các hướng dẫn của bạn với dữ liệu mà nó cần xử lý.
- Cho mô hình thời gian suy nghĩ: Các nhiệm vụ phức tạp đòi hỏi một chuỗi suy luận. Nếu bạn yêu cầu mô hình nhảy thẳng đến kết luận, thì khả năng mắc sai lầm suy luận sẽ cao hơn. Hãy chỉ bảo nó tự tìm ra giải pháp trước.
Tránh hiện tượng mơ hồ
Mô hình có thể tạo ra thông tin "nghe có vẻ hợp lý" nhưng sai sự thật. Luôn kiểm tra lại các sự kiện hoặc chỉ bảo mô hình trích dẫn nguồn để giảm thiểu rủi ro này.
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>
Question 1
Why should a developer prefer an Instruction Tuned LLM over a Base LLM for building an application?
Challenge: Generating Structured Data
Apply prompting principles to format output.
You have a list of ingredients. You need to convert this list into a JSON format for a web app.
Task
Write a prompt that requests JSON output with keys for 'item' and 'quantity'. Include a condition check: If the input is not a recipe, output "No recipe detected."
Solution:
prompt = "You will be provided with text. If it contains a recipe, convert it to JSON with keys 'item' and 'quantity'. If not, write 'No recipe detected.' Text: <user_input>"